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摘要 : 幸运 成 像 技术 是 用 于 消除 天 文 图 像 中 大 气 涡流 影响 的 高 分 辨 率 图 像 重建 技术 ， 传 统 
的 基于 CPU 的 幸运 成 像 算 法 难于 实时 化 。 本 文 利用 FPGA 并 行 处 理 的 优势 ， 设 计 了 一 种 基 
F FPGA 的 幸运 成 像 算 法 并 构建 了 一 个 FPGA 实验 系统 。 该 系统 用 FPGA 完成 了 选 图 、 配 准 、 
梧 加 的 全 部 幸运 成 像 算 法 流程 ， 所 得 高 分 辨 率 图 像 与 基于 传统 CPU 算法 处 理 的 结果 完全 相 
同 ， 但 幸运 成 像 算 法 的 处 理 速度 比 传统 CPU 的 处 理 速度 快 19 倍 。 该 算法 在 FPGA 上 的 实现 ， 
为 幸运 成 像 技术 的 实时 或 准 实时 化 提供 了 一 种 可 行 的 方案 。 
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标 成 像 质 量 的 影响 ， 常 见 且 有 效 的 方法 是 采用 自 适 应 光学 〈Adaptive Optics, AO) 技术 ， 
以 及 事后 处 理 方式 的 图 像 复原 技术 ， 幸 运 成 像 技术 就 是 其 中 之 一 。 幸 运 成 像 技术 利用 部 分 短 
曝光 图 像 中 包含 的 目标 高 分 辩 率 的 结构 信息 ， 在 观测 后 进行 图 像 重 建 ， 以 便 消 除 大 气 淇 流 
的 干扰 从 而 获得 高 分 辩 率 图 像 上 2。 本 世纪 初出 现 的 电子 倍增 电荷 耦合 器 件 〈Electron 
Multiplying Charge-Coupled Devices, EMCCD) 成 像 技术 具有 高 分 辨 率 、 高 读 出 速度 、 低 噪 
声 等 诸多 优点 ， 适 合 于 曝光 时 间 在 毫秒 及 其 以 上 量 级 的 微 光 成 像 领域 由 。 该 技术 的 出 现 ， 使 
得 幸运 成 像 技 术 获 得 了 长 足 的 进步 ， 并 在 在 天 文 观 测 领域 取得 了 极 大 的 成 功 ，2013 年 以 前 
发 表 的 论文 就 已 超过 200 多 篇 握 。 典 型 的 幸运 成 像 系 统 包 括 英国 剑桥 大 学 的 LuckyCam、 德国 
马 普 研究 所 的 AstraLux 和 西班牙 加 那 利 群 岛 天 文 研 究 所 的 FastCam， 他 们 在 双星 或 多 星系 
统 中 的 暗 伴 星 的 发 现 、 天 测 天 力 参 数 计算 等 方面 ， 科 学 产 出 极为 丰富 上 #3。 

幸运 成 像 技术 是 一 种 简单 可 行 的 图 像 复 原 方法 ， 但 由 于 图 像 复原 是 在 观测 完成 后 的 一 
段 时 间 内 进行 ， 其 缺点 也 是 明显 的 ， 即 天 文 观 测 人 员 对 于 所 拍摄 图 像 的 实时 信息 了 解 不 多 
难以 及 时 发 现 并 纠正 观测 中 可 能 存在 的 偏差 或 错误 。 解 决 此 问题 的 一 个 办 法 是 改进 算法 ， 增 
加 硬件 的 处 理 能 力 外 ， 将 幸运 成 像 技 术 实时 或 准 实时 化 。 

传统 的 中 央 处 理 器 (Central Processing Unit, CPU) 对 图 像 数 据 的 处 理 采 用 的 是 串 行 方 
式 ， 对 于 大 量 图 像 的 幸运 重建 来 说 ， 难 以 实现 实时 或 准 实 时 化 。 相 较 于 CPU， 现 场 可 编程 
逻辑 阵列 (Field Programmable Gate Array, FPGA) 器 件 有 着 先天 的 并 行 性 和 灵活 性 优势 ， 
能 提供 强大 的 并 行 计算 能 力 ， 可 加 速 数 据 或 信号 的 处 理 ， 特 别 是 图 像 处 理 钼 ,在 天 文 观测 
和 数据 设备 中 使 用 越 来 越 多 中 。 将 FPGA 用 于 幸运 成 像 ， 是 将 该 技术 实时 或 准 实时 化 的 一 种 
有 效 方法 。2008 年 FastCam 项 目 研 究 过 程 中 ， 首 次 将 幸运 成 像 技术 在 FPGA 硬件 上 实现 ， 
并 获得 了 实时 的 高 分 辩 率 图 像 09; 2015 年 Jackson 也 将 幸运 成 像 算 法 在 FPGA 和 GPU 中 实 
现 外 ,不 过 ， 他 们 在 论文 中 并 没有 对 算法 的 FPGA 实现 进行 细致 的 描述 .FPGA 与 幸运 成 像 算 
法 结合 的 研究 工作 国内 尚 无 报道 。 

本 文 对 传统 的 基于 CPU 和 程序 设计 语言 的 幸运 成 像 基本 算法 进行 了 简短 的 分 析 ， 结 合 
FPGA 技术 的 特点 ， 提 出 了 一 种 适合 于 FPGA 处 理 的 幸运 成 像 方案 ， 用 Verilog 硬件 描述 语 
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S HDL) 进行 各 功能 模块 的 设计 ， 并 将 幸运 成 像 算法 成 功 地 在 FPGA 开发 板 上 实现 ， 最 
后 利用 中 国 科 学 院 云南 天 文 台 丽 江 观 测 站 2.4m 天 文 望 远 镜 拍摄 的 大 量 目标 短 曝光 图 像 进行 
硬件 算法 设计 的 可 行 性 验证 。 


1 基于 FPGA 的 幸运 成 像 算法 处 理 流程 


幸运 成 像 算 法 的 基本 思想 是 按照 一 定 的 评价 标准 ， 从 一 系列 短 曝光 图 像 中 选 出 符合 评 
价 标准 的 “幸运 图 像 ” 或 区 域 ， 之 后 再 对 其 进行 配 准 欠 加 处 理 ， 以 获得 不 受 或 少 受 大 气 注 
流 影 响 的 高 分 辩 率 图 像 中 。 本 文 所 构建 的 幸运 成 像 系 统 在 实现 过 程 中 按照 基本 的 幸运 成 像 算 
法 的 设计 要 求 进行 ， 只 是 在 为 了 适应 本 系统 所 用 FPGA 的 处 理 逻 辑 与 资源 限制 ， 在 不 改变 
幸运 算法 基本 处 理 流程 〈 选 图 、 配 准 、 县 加 ) 的 基础 上 将 该 算法 用 Verilog HDL 重新 进行 了 
设计 。 
1.1 幸运 图 像 的 选取 
在 一 系列 短 曝光 序列 图 像 中 选 出 “幸运 图 像 ” 是 最 终 获 得 高 分 辨 图像 的 关键 因素 。 然 而 
为 获得 “幸运 图 像 ” 必 须 选 取 一 个 合适 的 像 质 评价 函数 。 对 于 空间 点 源 目标 图 像 来 说 ， 像 质 
二 评价 函数 通常 采用 图 像 的 斯 特 列 尔 比 (Strehl Ratio, SR) 作为 评价 标准 。 由 于 SR 定义 为 存 
CD 在 像 差 时 图 像 的 峰值 光 强 与 不 存在 像 差 时 图 像 的 峰值 光 强 之 比 ， 因 此 ， 计 算 时 需要 理想 的 
~ 无 像 差 峰值 光 强 。 但 这 个 理想 的 峰值 光 强 在 现实 中 并 不 容易 获得 ， 故 通常 采用 其 它 的 替代 方 
案 。 一 个 简单 且 有 效 的 方法 是 使 用 瞬时 的 斯 特 列 尔 比 作为 图 像 的 像 质 评价 函数 四 ， 即 只 对 
图 像 上 的 峰值 光 强 像素 点 的 灰 度 值 进行 SR 值 估算 。 
对 于 FPGA 这 类 运算 资源 有 限 的 硬件 ， 计 算 SR 只 能 采用 简单 的 处 理 方式 。 具 体 来 说 ， 
在 本 系统 实现 过 程 中 ， 直 接 使 用 有 像 差 时 图 像 的 峰值 光 强 像素 点 的 灰 度 值 。 由 于 在 配 准 过 程 
中 对 每 帧 图 像 的 峰值 光 强 像素 点 灰 度 值 的 位 置 有 要 求 ， 故 在 本 系统 选 图 过 程 中 ， 以 图 像 的 
= 峰值 光 强 像素 点 灰 度 值 及 其 位 置 共 同 对 图 像 进行 像 质 评价 。 


1.2 图 像 的 配 准 与 又 加 

配 准 是 幸运 成 像 处 理 中 最 重要 的 一 环 ， 如 若 配 准 不 当 就 会 直接 导致 和 加 后 的 图 像 模糊 
不 清 ， 分 辨 率 下 降 ， 从 而 无 法 将 暗 弱 目标 图 像 显示 出 来 。 由 于 本 系统 使 用 的 是 恒星 的 图 像 ， 
所 以 最 常用 的 配 准 方法 有 两 种 ， 一 种 是 以 整 幅 图 像 中 的 最 大 灰 值 为 中 心 截取 所 需 的 成 像 区 
[= 域 ， 另 一 种 则 是 以 图 像 的 质心 为 配 准 基点 。 由 于 FPGA 硬件 逻辑 及 资源 的 限制 ， 本 系统 采用 
Q 前 一 种 配 准 方法 。 
图 像 配 准 完成 后 ， 则 需要 对 配 准 图 像 进行 到 加 。 在 本 系统 中 由 于 所 选 图 像 数 量 偏 小 ， 
所 以 采用 的 直接 县 加 方法 。 巷 加 后 所 得 像 图 再 进行 灰 度 变换 ( 即 锐 化 ) 便 可 得 到 易于 观察 的 
高 分 辩 率 图 像 。 


2 ”幸运 成 像 算 法 的 FPGA 实现 


本 文 所 述 的 幸运 成 像 算法 实现 的 硬件 平台 是 以 Xilinx 公司 Spartan-6 系列 的 XC6SLX16 
芯片 为 核心 的 开发 板 。 开 发 环境 为 ISE Design Suite 14.7， 届 辑 设计 所 用 HDL Æ Verilog, X 
用 ChipScope pro 14.7 和 ModelSim 10.1d 进行 硬件 设计 的 验证 与 调试 。 


2.1 算法 总 体 设 计 

由 于 本 项 目 设计 的 主要 目的 是 在 FPGA 硬件 上 实现 幸运 成 像 算法 ， 因 此 为 读 取 图 片 像 
素数 据 ， 首 先 将 天 文 短 曝光 图 像 存 储 在 开发 板 外 挂 的 安全 数据 卡 〈 Secure Digital Card， 即 
SDF) 中 ， 以 便 给 算法 模块 读 取 图 像 数据 。 此 外 ， 为 满足 算法 对 速度 及 片 内 存储 的 要 求 ， 
同时 由 于 所 用 蕊 片 逻辑 资源 和 存储 空间 的 限制 ， 故 在 数据 处 理 方式 上 本 文采 用 数据 流 ， 即 


逐 像素 处 理 的 方式 ， 但 在 每 个 模块 内 以 及 各 个 模块 间 均 采 ) 
理 。 与 此 同时 在 片 内 数据 的 存储 上 为 使 处 理 速度 和 存储 器 之 | 
端口 随机 存储 器 (Random Access Memory, RAM) 模块 作为 数据 缓存 器 。 然 而 ， 由 于 所 
FPGA 芯片 RAM 资源 以 及 逻辑 资源 的 约束 ， 只 能 


j 的 是 并 行 的 方式 对 数据 进行 处 


对 1000 张 128x128 像素 大 小 的 短 曝 光 图 


司 达到 最 佳 状 态 ， 采 用 片 内 的 双 


像 作 选 图 处 理 ， 并 且 在 配 准 过 程 中 只 能 最 大 截取 64x64 像素 大 小 的 图 片 进行 配 准 处 理 ， 并 


最 终 以 64x64 像素 大 小 显示 幸运 成 像 结果 。 


对 于 整个 算法 的 硬件 构架 来 说 ， 为 了 算法 实现 过 程 中 修改 及 调试 的 方便 ， 采 用 了 模块 


图 片 序号 及 最 
大 灰 度 值 位 置 
选 图 模块 灰 度 值 位 置 


‘ep 
的 首 地 址 


图 1 基于 FPGA 的 幸运 成 像 算法 的 结构 框图 


化 的 设计 方式 。 主 要 模块 包括 数据 的 读 写 、 保 存 模 块 ， 短 曝光 图 像 的 选 图 、 配 准 、 和 县 加 模块 以 
及 最 终 的 重建 高 分 辩 率 图 像 显示 模块 ， 并 用 Verilog HDL 进行 设计 实现 。 基 于 FPGA 实现 的 
幸运 成 像 算 法 的 结构 框图 如 图 1 所 示 。 这 一 幸运 成 像 的 FPGA 硬件 的 工作 流程 可 描述 如 下 。 


重建 图 像 保存 


图 像 灰 度 变换 VGA 驱 动 模 
模块 块 


Fig. 1 Structure block diagram of lucky imaging algorithm based on FPGA 
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系统 上 电 后 ，SD -FH 


Interface, SPI) 以 6.25Mb/s 的 速度 不 断 地 向 SD 卡 顶 


存储 的 天 文 图 像 数 据 会 通过 串 行 外 设 接 口 〈Serial Peripheral 
层 模块 传送 ， 经 SD 卡 顶 层 模块 处 理 


过 的 数据 经 先入 先 出 (First-In First-Out, FIFO) 缓冲 器 不 断 地 向 第 三 代 双 倍数 据 率 同 步 动 
态 随 机 存 取 存储 器 ( Double-Data-Rate Three Synchronous Dynamic Random Access 
Memory, DDR3) 写 数据 模块 中 写 入 (DDR3 速度 666Mb/s) ， 然 后 再 通过 DDR3 写 数 据 
模块 的 处 理 ， 向 FPGA 芯片 外 部 的 DDR3 存储 器 中 写 入 图 像 数据 。 在 写 数据 模块 向 DDR3 写 


入 像素 数据 的 同时 ， 选 图 模块 也 不 断 地 对 每 帧 图 片 的 像素 值 进行 最 大 灰 度 值 求解 ， 然 后 再 
对 求 出 的 所 有 图 片 的 最 大 灰 度 值 排序 ， 当 排序 结束 ， 也 就 说 明 选 图 结束 ， 产 生 选 图 结束 信 


“Jo 


其 后 ， 便 


a 


以 便 配 准 模块 向 DDR3 读数 据 模块 发 送 所 选 图 片 首 像素 地 址 


发 送 给 DDR3 读数 据 模 块 ， 当 选 图 结束 信号 和 所 选 
据 模块 时 ， 该 模块 便 会 将 数据 从 DDR3 存储 器 中 读 出 满足 条 件 的 图 片 像素 进行 琶 加 处 理 。 虽 


相配 准 模 块 发 送 要 截取 的 原始 图 片 的 序号 以 及 该 图 片 最 大 灰 度 值 位 置 参数 ， 


,与 此 同时 ， 选 图 结束 信号 也 会 


图 像 首 像素 地 址 同时 作用 于 DDR3 读数 


然 从 图 1 的 流程 上 看 ， 配 准 、DDR3 MSA MRS PRR ITH, (HA HDL 设计 及 


FPGA 实现 时 ， 它 们 是 并 行 的 ， 它 们 的 运行 从 时 


当 所 选 的 全 部 图 片 辣 加 完成 后 ， 再 将 结果 i 


区 域 的 可 视 性 。 然 后 再 将 最 终 高 分 辨 率 图 像 的 像素 数据 保存 在 片 内 RAM 中 。 当 保存 完毕 后 ， 


fH) Fae BAY 


47 oy Bee 


E 灰 度 变换 的 处 理 ， 以 增强 目标 
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再 通过 视频 图 形 阵列 (Video Graphics Array, VGA) 驱动 模块 驱动 ， 将 灰 度 图 在 VGA 显示 
器 上 显示 。 


2.2 选 图 模块 的 设计 

在 选 图 模块 的 实现 上 本 系统 主要 采用 最 大 灰 度 值 求解 模块 以 及 最 大 灰 度 值 排序 模块 共 
同 搭建 而 成 ， 这 两 个 子 模块 的 搭建 主要 是 由 比较 器 、 计 数 器 以 及 片 内 RAM 存储 器 来 完成 的 。 
其 中 最 大 灰 度 值 查找 模块 的 状态 转移 图 如 图 2 所 示 。 


(myvalid=1)&&(cnt>0)&&(cnt< 16383) 


myvalid=1 


从 SD 卡 中 读 像 缓存 读 出 的 像 


判断 每 帧 图 像 ; 
缓存 查找 出 的 
最 大 灰 度 值 是 每 帧 图 像 的 最 


否 满足 配 准 
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(eve_t=1)&&(pic_ num=1) 


图 2 最 大 灰 度 值 查找 的 状态 转移 图 
Fig. 2 State transfer graph of maximum gray value lookup 

在 图 2 中 myvaild=1 表示 SD 卡 中 的 数据 可 以 取出 ，cnt 表示 已 读 取 的 一 帧 图 像 的 像素 
数目 ， 其 中 cnt=0 表示 一 帧 图 像 的 全 部 像素 已 读 完 。eve tl 表示 单 帧 图 像 的 最 大 灰 度 值 开 
始 取出 ，pic_num 表示 图 像 的 帧 数 ，wea_max=1 表示 可 以 开始 向 RAM 中 写 数据 。 从 3.1 节 
中 可 知 ， 在 本 设计 中 所 用 的 图 像 大 小 为 128x128 ， 帧 数 为 1000， 所 以 ent 最 大 为 
16383，Ppic_num 最 大 为 999。 

从 图 2 中 可 以 看 出 ， 该 模块 的 主要 功能 是 对 从 SD 卡 中 读 出 的 图 片 像素 值 逐个 进行 比 
较 ， 以 找 出 每 帧 图 像 的 最 大 灰 度 值 并 将 其 保存 在 片 内 RAM 中 供 排序 使 用 。 值 得 注意 的 是 ， 
在 每 求 出 一 帧 图 像 最 大 灰 度 值 后 ， 在 条 件 触发 时 先 将 其 缓存 ， 然 后 等 相应 条 件 到 来 时 再 将 
其 进行 判断 ， 看 其 是 否 满足 配 准 对 最 大 灰 度 值 位 置 的 要 求 。 满 足 则 在 RAM 相应 的 地 址 空间 
中 保存 该 像素 值 ， 不 满足 则 在 RAM 相应 的 地 址 空间 中 存 入 与 该 最 大 灰 度 值 相同 比特 位 数 
的 零 值 。 其 次 ， 在 向 RAM 中 保存 每 帧 图 像 最 大 灰 度 值 时 ， 要 同时 将 该 最 大 灰 度 值 所 在 的 图 
片 序 号 及 位 置 参数 一 并 保存 在 RAM 相应 地 址 空间 中 ， 以 便 进行 并 行 串 行 混 合 排序 。 


2.3 配 准 模块 的 设计 

在 配 准 算法 的 实现 上 ， 采 用 以 最 大 灰 度 值 为 图 片 中 心 ， 截 取 64x64 像素 大 小 进行 全 加 
处 理 ， 其 设计 主要 是 通过 选 图 模块 中 发 送 的 最 大 灰 度 值 所 在 图 片 序号 以 及 其 位 置 参 数 ， 再 
根据 式 (1) 计 算出 要 截取 的 图 片 首 地 址 ， 然 后 发 送 给 DDR3 读数 据 模块 ， 用 以 从 DRR3 存储 
器 中 读 出 相应 的 图 片 像素 值 ， 供 镭 加 模块 处 理 ， 该 模块 并 不 占用 片 内 RAM 资源 ， 只 是 少 
量 的 使 用 了 Slices 资源 。 
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c3_p0_cmd _addr_r=((pic_cnt—1)x 65536)+ (INT(max_ ant/2 -31)x128 -1|x4 (1) 
+(max_ent — INT(max_cnt/2’)x128)-31 


其 中 ，c3 p0_cmd 


addr 了 表示 要 


灰 度 值 所 在 的 


实现 。 


图 片 序号 ， 


INT(max_ent /2") 387% Max_cnt 


2.4 BMRA 


对 于 


F A RAM 个 数 为 12 #2) 37.5%. 


第 k 帧 


Wi AVR 


3 


实验 结果 及 其 分 析 
为 了 验证 前 面 所 述 的 幸运 成 像 算法 在 FPGA 上 实现 的 


除 以 27 之 后 只 


图 像 的 全 加 主要 是 通过 片 内 RAM 资源 的 使 用 实现 的 ， 在 县 


要 读 取 的 DDR3 的 地 址 ， pic_ cnt # 
max_cnt 表示 要 读 取 的 最 大 灰 度 值 在 
整数 部 分 ， 在 FPGA 实现 时 用 移 位 寄存 器 
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Fig. 3 Block diagram of stacking module 


同 的 幸运 成 像 算法 编程 并 将 其 在 PC HLE KIA 
去 成 像 算 法 的 处 理 时 间 问 题 ， 
一 是 与 MATLAB 处 型 


FPGA 上 运行 幸运 
设计 了 两 个 实验 ， 
实验 。 


幸运 成 像 实 验 ， 必 须 有 天 文 目 
天 文 台 丽江 观测 站 对 天 文 双 星 HDS 70 
哗 等 人 的 论文 
多 次 随机 从 10000 帧 图 
图 像 进 行 处 理 。 


3.1 幸运 成 像 算法 在 CPU+MATLAB 上 的 平 
Dell Precision T5500 
的 软件 环境 是 Windows 7 操作 系统 、MATLAB R2014a。 
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将 随机 抽取 的 1000 Wi 128x128 像素 大 小 的 图 像 进行 分 组 ， 然 后 在 MATLAB 分 别 对 每 


组 图 像 均 进行 同样 的 算法 处 到 
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(a) 2D gray image 


结果 一 致 。 


(b) 三 维 灰 度 分 布 
(b) 3D gray distribution map 


KI 


比 取 为 1%， 所 得 到 如 图 4 所 示 的 高 分 辨 率 图 像 和 三 维 灰 


图 4 1% 选 图 比 下 所 得 的 高 分 辩 率 图 像 


Fig. 4 High-resolution image obtained at 1% selection rate 


3.2 幸运 成 像 算 法 在 FPGA 上 的 实验 验证 
硬件 平台 是 以 Xilinx 公司 Spartan-6 系列 的 XC6SLX16 芯片 为 核心 的 开发 板 。 基 于 
FPGA 上 实现 的 幸运 成 像 算法 设计 的 验证 ， 采 用 1% 的 选 图 比 ， 即 随机 的 1000 帧 选 10 帧 ， 
执行 与 MATLAB 相同 幸运 成 像 的 算法 处 理 ， 然 后 用 ChipScope 捕捉 最 终结 果 图 中 最 大 灰 度 
值 周 围 部 分 像素 数据 值 ， 得 到 了 如 图 5(a) 图 所 示 的 经 FPGA 实现 的 幸运 成 像 算 法 处 理 所 得 
的 高 分 辩 率 图 像 部 分 像素 数据 值 ， 并 与 如 图 5(b) 图 所 示 的 经 MATLAB 实现 的 幸运 成 像 算法 
处 理 所 得 的 高 分 辨 率 图 像 的 相同 部 分 像素 值 做 对 比 。 
ER og Bd 
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(a) FPGA 处 理 的 结果 
(a) Results of FPGA processing 


sumimage 
EB 64x64 double 


} 30 31 32 
32 3834| 3869 4373 6436 4615 4261 3920 3925 3785 3706 3697 3796 3879 3877 3679 3655 3485| ^ 


(b) MATLAB 处 理 的 结果 
(b) Results of MATLAB processing 
图 5 分 别 用 FPGA 4G MATLAB 处 理 所 得 图 像 像素 数值 
Fig. 5 Image pixel values processed by FPGA and MATLAB respectively 

通过 图 5 可 知 ， 经 FPGA 上 实现 的 幸运 成 像 算法 处 理 所 得 图 像 的 最 终 像 素数 据 与 在 
MATLAB 上 做 同样 算法 处 理 所 得 图 像 像素 数据 完全 相同 。 

从 处 理 效果 上 来 看 ， 最 终 得 到 的 高 分 辩 率 图 像 像素 值 较 小 ， 直 接 通过 显示 器 显示 图 像 
时 ， 无 论 在 MATLAB 上 还 是 FPGA 上 做 算法 处 理 所 得 的 高 分 辨 率 图 像 都 比较 模糊 ， 所 以 ， 
TE FPGA 和 MAILAB 上 均 对 算法 处 理 所 得 的 高 分 辨 率 图 像 做 了 相同 的 灰 度 变换 处 理 一 一 锐 
化 或 图 像 增强 ， 将 最 终 得 到 的 高 分 辨 紊 图 像 中 感 兴趣 的 目标 或 区 域 突出 出 来 ， 分 别 得 到 了 
如 图 6(a) 图 、6(b) 图 所 示 的 最 终 高 分 辨 率 图 像 。 


(a) FPGA 处 理 的 结果 (b) MATLAB 处 理 的 结果 


(a) Results of FPGA processing (b) Results of MATLAB processing 


6 基于 FPGA 和 MATLAB 实现 的 幸运 成 像 算 法 处 理 所 得 的 高 分 辨 率 图 像 

Fig. 6 High-resolution images Obtained by lucky imaging algorithm based on the FPGA and the MATLAB 
6(a) 是 经 FPGA 上 实现 的 幸运 成 像 算 法 处 理 所 得 的 高 分 辩 率 图 像 以 1024x768 的 分 辨 
率 在 XGA 显示 器 上 显示 并 通过 手机 拍摄 得 到 的 ， 在 此 采用 手机 拍摄 获得 ， 是 因为 本 系统 
实现 所 采用 的 FPGA 开发 板 是 一 个 独立 的 外 部 系统 ， 它 是 脱离 PC 机 单独 工作 的 ， 所 以 基 
于 FPGA 硬件 实现 的 幸运 成 像 算 法 处 理 后 所 得 的 高 分 辩 率 图 像 要 通过 单独 的 XGA 显示 器 进 
行 显示 ， 因 此 它 与 PC 机 上 MATLAB 所 得 高 分 辨 率 结果 图 获取 方式 不 同 ， 它 不 能 像 


MATLAB 一 样 直接 进行 图 像 截屏 ， 而 只 能 采用 外 部 的 图 像 采 集 设 备 进行 图 像 获 取 ， 所 以 经 
FPGA 上 实现 的 幸运 成 像 算 法 处 理 所 得 的 高 分 辨 率 图 像 在 本 文中 采用 手机 拍摄 得 到 。 而 图 
6(b) 经 MATLAB 处 理 后 显示 的 最 终 高 分 辩 率 图 像 是 以 1280x768 的 WXGA 分 辩 率 显示 的 。 
由 于 两 图 的 显示 器 分 辨 率 不 同 导致 纵 横 比 不 同 ， 导 臻 相同 图 像 在 显示 上 稍 有 差异 。 此 外 ， 图 
6(a) 是 手机 拍摄 获得 的 ， 由 于 手机 拍摄 角度 及 分 辨 率 的 不 同 所 以 导致 图 像 有 些许 变化 。 不 过 ， 
仍然 可 看 出 这 两 幅 图 像 是 基本 相同 的 ， 这 说 明 经 FPGA 上 实现 的 幸运 成 像 算 法 处 理 后 的 结 
RAZ MATLAB 实现 的 幸运 成 像 算法 处 理 后 的 结果 一 致 ， 从 而 说 明基 于 FPGA 实现 的 幸运 
成 像 算法 设计 正确 。 

综 上 所 述 ， 无 论 是 从 最 终 高 分 辩 率 图 像 中 的 像素 数据 值 对 比 来 看 ， 还 是 从 灰 度 变换 后 
的 直观 显示 出 来 最 终 高 分 辩 率 图 像 对 比 来 看 ， 都 说 明了 基于 FPGA 实现 的 幸运 成 像 算 法 设 
计 与 实现 的 正确 性 。 


3.3 FPGA 上 实现 幸运 成 像 算 法 的 优势 

FPGA 的 并 行 性 和 灵活 性 是 其 最 大 的 优势 ， 因 此 相 较 于 传统 的 CPU，FPGA 对 同样 算 
法 的 处 理 速 度 肯定 快 , 但 对 于 所 研究 的 幸运 成 像 算 法 来 说 ， 具 体 快 多 少 ， 必 须 通 过 实验 来 说 
明 。 为 此 ， 分 别 在 FPGA 和 CPU+MATLAB 上 对 相同 幸运 算法 的 运算 速度 进行 了 测试 。 实 验 
过 程 中 ， 统 计 1000 帧 图 像 的 处 理 时 间 ， 选 图 比 采 用 1%. FPGA 及 CPU+MATLAB 平台 上 均 
采用 2.1 节 中 介绍 的 算法 进行 实现 。 由 此 得 到 了 不 同 平台 下 相同 算法 的 平均 运行 时 间 : 对 于 
FPGA 是 2.45s， 对 于 CPU+MATLAB Æ 46.938; 运行 所 得 结果 (高 分 辩 率 图 像 ) 分 别 如 图 
6(a)、6(b) 图 所 示 。 显 然 ， 相 同 的 算法 在 不 同 的 平台 处 理 下 ， 得 到 相同 的 高 分 辩 率 图 像 ， 
FPGA 平台 上 算法 处 理 速 度 比 CPU+MATLAB 平台 上 算法 处 理 速度 快 约 19 倍 。 如 果 采 用 更 
先进 的 FPGA 器 件 ， 速 度 还 将 加 快 。 

不 过 受制 于 SD 卡 的 速度 ， 总 体 运行 时 间 并 没有 明显 的 优势 。 目 前 ， 我 们 正在 设计 基于 
USB3 和 千 兆 以 太 网 的 高 速 数据 接口 ， 以 加 速 整 个 幸运 成 像 处 理 的 速度 。 另 外 ， 采 用 处 理 能 
力 更 强 、 逻 辑 资 源 更 多 的 FPGA 器 件 ， 可 以 更 多 地 引入 并 行 计算 、 减少 串 行 处 理 过 程 ， 充 分 
发 挥 FPGA 硬件 加 速 的 优势 。 


4 结论 


本 文 首先 简 述 了 柱 运 算法 的 基本 思想 及 处 理 流程 ， 根 据 所 用 FPGA 的 硬件 资源 ， 用 
Verilog HDL 设计 了 地 运 成 像 算法 的 选 图 、 配 准 、 稚 加 等 关键 模块 ， 详 细 介 绍 了 这 些 模 块 的 实 
MIR, ÝE FPGA 开发 板 上 实现 了 这 一 幸运 成 像 系统 。 然后， 通过 将 FPGA 处 理 的 结果 与 
PC 上 用 MATLAB 处 理 得 到 的 结果 进行 对 比 ， 证 明了 此 系统 设计 和 实现 过 程 的 正确 性 。 最 后 ， 
通过 对 FPGA 与 CPU+MATLAB 平台 下 实现 相同 算法 所 需 的 处 理 时 间 的 对 比分 析 ， 说 明了 
FPGA 在 处 理 速度 上 快 19 倍 的 优势 。 虽 然 本 设计 方案 还 有 一 些 可 以 改进 之 处 ， 但 就 地 运 成 
像 算法 在 FPGA 开发 板 上 的 具体 实现 ， 为 构建 实时 化 的 高 速 笠 运 成 像 系 统 探索 了 一 种 可 行 
的 技术 方法 。 
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Implementation of Lucky Imaging Algorithm Based on FPGA 
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Technology, Kunming, Yunnan 650051, China) 


ABSTRACT: Lucky imaging is a kind of high-resolution image reconstruction techniques used to 
eliminate the influence of atmospheric turbulence on astronomical images. Its algorithm is usually 
implemented on the CPU-based platform, and cannot meet the requirement of real-time high- 
resolution imaging. Taking advantages of FPGA parallel processing, this paper presents a new 
lucky imaging algorithm based on FPGA, and builds an experimental system which uses FPGA to 
complete all the lucky imaging processes of the image selection, registration, stacking. The 
obtained image reconstructed by the FPGA system is exactly the same with the image processed 
by the traditional CPU platform. Nevertheless, it is important that the processing speed of the 
system is 19 times faster than that of the CPU platform. The implementation of the algorithm on 
FPGA provides us with a feasible scheme to make lucky imaging technology real-time or quasi 


real-time. 
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